iT邦幫忙

2023 iThome 鐵人賽

DAY 20
0
AI & Data

AI與語音辨識系列 第 20

DAY20 語音辨識的前端—VAD篇 part1

  • 分享至 

  • xImage
  •  

你好!


前言

VAD 是 "Voice Activity Detection" 的縮寫,翻譯成中文為 "語音活動檢測"。它是一個在語音處理中常用的技術,用於檢測語音信號中是否存在語音活動,以及識別語音活動和非語音活動的時間段。

VAD 的主要用途和優勢包括:

  1. 噪音消除:在通信和錄音應用中,檢測並去除非語音活動的部分有助於減少噪音,提高語音品質。

  2. 節省頻寬:在語音通信中,如果在非語音時段停止傳輸音訊,可以節省頻寬資源。

  3. 語音識別:在語音識別系統中,VAD 可用於確定何時開始和結束錄製語音,從而改進識別性能。

  4. 節省能源:在便攜設備上使用 VAD 可以減少能源消耗,因為它只在偵測到語音時才啟動語音處理器。

VAD 的實現方式有多種,包括基於能量閾值、基於語音特徵的方法(如倒譜係數、短時能量等),以及機器學習方法(如神經網絡)。這些方法通常根據具體應用的需求和環境來選擇。

總之,VAD 是一個用於檢測語音活動的重要技術,它在語音處理和通信中有多種實際應用,有助於提高語音品質、節省資源和改進語音識別性能,明天會更深入的提及VAD的三大巨頭,敬請期待~


參考書籍:Hey Siri及Ok Google原理:AI語音辨識專案真應用開發
參考網站:今日無
學習對象:ChatGPT


上一篇
DAY19 語音辨識前端之前言—下
下一篇
DAY21 語音辨識的前端—VAD篇 part2
系列文
AI與語音辨識30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言